本文研究了控制多机器人系统以自组织方式实现多边形形成的问题。与典型的形成控制策略不同,在该策略中,机器人被转向以满足预定义的控制变量,例如成对距离,相对位置和轴承,本文的最重要思想是通过将控制输入随机输入到一些机器人(说说)(说说) ,组的顶点机器人),其余的遵循的简单原理是向环形图中的两个最近邻居的中点移动,而没有任何外部输入。在我们的问题中,机器人最初分布在飞机上。 Sopalled Vertex机器人负责确定整个编队的几何形状及其整体大小,而其他人则移动,以最大程度地减少两个直接邻居的差异。在第一步中,每个顶点机器人估计其相关链中机器人的数量。用于估计的两种类型的控制输入是使用最新和最后两次瞬间的测量设计设计的。在第二步中,提出了自组织的形成控制法,只有顶点机器人收到外部信息。两种估计策略之间的比较是根据收敛速度和稳健性进行的。在模拟和物理实验中,整个控制框架的有效性得到了进一步验证。
translated by 谷歌翻译
采样在机器学习方法中无处不在。由于大数据集和模型复杂性的增长,我们希望在训练A表示时学习和适应采样过程。为了实现这一宏伟的目标,已经提出了各种抽样技术。但是,他们中的大多数要么使用固定采样方案,要么基于简单的启发式方法调整采样方案。他们不能选择在不同阶段进行模型培训的最佳样本。受认知科学中的“思考,快速和系统2)的启发,我们提出了一种奖励指导的采样策略,称为自适应样本,并奖励(ASR)来应对这一挑战。据我们所知,这是利用强化学习(RL)解决代表学习中抽样问题的第一项工作。我们的方法最佳地调整了采样过程以实现最佳性能。我们通过基于距离的采样来探索样品之间的地理关系,以最大程度地提高整体累积奖励。我们将ASR应用于基于相似性的损失函数中的长期抽样问题。信息检索和聚类中的经验结果证明了ASR在不同数据集中的出色性能。我们还讨论了一种令人着迷的现象,我们将其称为实验中的“ ASR重力”。
translated by 谷歌翻译
我们提出了一系列新的结构化强化学习政策 - 构造,即隐含的两塔(ITT)策略,其中根据其可学习潜在表示的注意力分数选择了这些动作。通过明确将行动与政策堆栈中的国家处理相关,我们实现了两个主要目标:实质性的计算增长和更好的绩效。我们的体系结构都与:离散和连续的动作空间兼容。通过对OpenAI Gym和DeepMind Control Suite的15个环境进行测试,我们表明ITT构造特别适合黑盒/进化优化,相应的政策培训算法优于其无结构的隐式对应物以及常用的明确政策。我们通过展示诸如哈希和懒惰的塔更新等技术如何依赖于ITT的两个较高的ITT结构等技术来补充我们的分析,以获得其他计算改进。
translated by 谷歌翻译
在过去的十年中,电子商务的自动产品描述生成已经取得了重大进步。产品文案旨在通过通过文本描述突出产品特征来吸引用户的兴趣并改善用户体验。随着电子商务平台提供的服务变得多样化,有必要动态地调整自动生成描述的模式。在本文中,我们将基于电子商务前缀的可控文案生成(EPCCG)系统部署到JD.com电子商务产品推荐平台中的经验。系统的开发包含两个主要组成部分:1)文案写作方面提取; 2)弱监督的方面标签; 3)具有基于前缀的语言模型的文本生成; 4)文案写作质量控制。我们进行实验以验证拟议的EPCCG的有效性。此外,我们将与EPCCG合作的已部署架构介绍到实时JD.com电子商务推荐平台以及部署以来的巨大回报。
translated by 谷歌翻译
几个世纪以来,科学家一直观察到自然要了解支配物理世界的法律。将观察变成身体理解的传统过程很慢。构建和测试不完善的模型以解释数据中的关系。强大的新算法可以使计算机通过观察图像和视频来学习物理。受这个想法的启发,而不是使用物理量训练机器学习模型,我们使用了图像,即像素信息。对于这项工作和概念证明,感兴趣的物理学是风向的空间模式。这些现象包括风水沙丘和火山灰沉积,野火烟雾和空气污染羽状的特征。我们使用空间沉积模式的计算机模型仿真来近似假设成像设备的图像,其输出为红色,绿色和蓝色(RGB)颜色图像,通道值范围为0到255。在本文中,我们探索深度卷积神经网络基于基于风向的空间模式的关系,通常在地球科学中发生,并降低其尺寸。使用编码器降低数据维度大小,可以训练将地理和气象标量输入数量连接到编码空间的深层,完全连接的神经网络模型。一旦实现了这一目标,使用解码器重建了完整的空间模式。我们在污染源的空间沉积图像上证明了这种方法,其中编码器将维度压缩到原始大小的0.02%,并且测试数据上的完整预测模型性能的精度为92%。
translated by 谷歌翻译
使用深度自动化器来编码地震波形特征的想法,然后在不同的地震应用中使用它们是吸引人的。在本文中,我们设计了测试,以评估使用AutoEncoders作为不同地震应用的特征提取器的这种想法,例如事件辨别(即,地震与噪声波形,地震与爆炸波形和相位拣选)。这些测试涉及在大量地震波形上训练AutoEncoder,无论是均匀的还是超越,然后使用培训的编码器作为具有后续应用层的特征提取器(完全连接层,或卷积层加上完全连接的层)做出决定。通过将这些新设计模型的性能与从头开始培训的基线模型进行比较,我们得出结论,AutoEncoder特征提取器方法可以在某些条件下执行良好,例如当目标问题需要与AutoEncoder编码的功能类似,何时有相对少量的培训数据,并且当使用某些模型结构和培训策略时。在所有这些测试中最佳工作的模型结构是具有卷积层和完全连接的层的过度普遍的AutoEncoder,以进行估计。
translated by 谷歌翻译
经过大量地震后,我们可以看到个人和媒体机构在社交媒体平台上发布的图像由于这些天智能手机的大规模使用而发布。这些图像可用于提供关于公共和研究群落的地震区域震荡损坏的信息,并且可能导致救援工作。本文提出了一种自动化的方法,可以在来自诸如Twitter等社交媒体平台的地震之后提取损坏的建筑图像,从而识别包含此类图像的特定用户帖子。使用传输学习和〜6500手动标记图像,我们培训了深入学习模型,以识别现场损坏的建筑物的图像。当在土耳其2020 M7.0地震发生后,在不同地区的新收购的地震图像上进行地震图像的地震图像时,训练有素的模型取得了良好的表现。此外,为了更好地了解模型如何做出决策,我们还实现了Grad-CAM方法来可视化促进决策的图像上的重要位置。
translated by 谷歌翻译
Dataset distillation has emerged as a prominent technique to improve data efficiency when training machine learning models. It encapsulates the knowledge from a large dataset into a smaller synthetic dataset. A model trained on this smaller distilled dataset can attain comparable performance to a model trained on the original training dataset. However, the existing dataset distillation techniques mainly aim at achieving the best trade-off between resource usage efficiency and model utility. The security risks stemming from them have not been explored. This study performs the first backdoor attack against the models trained on the data distilled by dataset distillation models in the image domain. Concretely, we inject triggers into the synthetic data during the distillation procedure rather than during the model training stage, where all previous attacks are performed. We propose two types of backdoor attacks, namely NAIVEATTACK and DOORPING. NAIVEATTACK simply adds triggers to the raw data at the initial distillation phase, while DOORPING iteratively updates the triggers during the entire distillation procedure. We conduct extensive evaluations on multiple datasets, architectures, and dataset distillation techniques. Empirical evaluation shows that NAIVEATTACK achieves decent attack success rate (ASR) scores in some cases, while DOORPING reaches higher ASR scores (close to 1.0) in all cases. Furthermore, we conduct a comprehensive ablation study to analyze the factors that may affect the attack performance. Finally, we evaluate multiple defense mechanisms against our backdoor attacks and show that our attacks can practically circumvent these defense mechanisms.
translated by 谷歌翻译
Blind image quality assessment (BIQA) remains challenging due to the diversity of distortion and image content variation, which complicate the distortion patterns crossing different scales and aggravate the difficulty of the regression problem for BIQA. However, existing BIQA methods often fail to consider multi-scale distortion patterns and image content, and little research has been done on learning strategies to make the regression model produce better performance. In this paper, we propose a simple yet effective Progressive Multi-Task Image Quality Assessment (PMT-IQA) model, which contains a multi-scale feature extraction module (MS) and a progressive multi-task learning module (PMT), to help the model learn complex distortion patterns and better optimize the regression issue to align with the law of human learning process from easy to hard. To verify the effectiveness of the proposed PMT-IQA model, we conduct experiments on four widely used public datasets, and the experimental results indicate that the performance of PMT-IQA is superior to the comparison approaches, and both MS and PMT modules improve the model's performance.
translated by 谷歌翻译
The development of social media user stance detection and bot detection methods rely heavily on large-scale and high-quality benchmarks. However, in addition to low annotation quality, existing benchmarks generally have incomplete user relationships, suppressing graph-based account detection research. To address these issues, we propose a Multi-Relational Graph-Based Twitter Account Detection Benchmark (MGTAB), the first standardized graph-based benchmark for account detection. To our knowledge, MGTAB was built based on the largest original data in the field, with over 1.55 million users and 130 million tweets. MGTAB contains 10,199 expert-annotated users and 7 types of relationships, ensuring high-quality annotation and diversified relations. In MGTAB, we extracted the 20 user property features with the greatest information gain and user tweet features as the user features. In addition, we performed a thorough evaluation of MGTAB and other public datasets. Our experiments found that graph-based approaches are generally more effective than feature-based approaches and perform better when introducing multiple relations. By analyzing experiment results, we identify effective approaches for account detection and provide potential future research directions in this field. Our benchmark and standardized evaluation procedures are freely available at: https://github.com/GraphDetec/MGTAB.
translated by 谷歌翻译